摘要。我们提出了可扩展的插值变压器(SIT),这是建立在扩散变压器(DIT)骨架上的生成模型家族。与标准扩散模型更灵活地连接两个分歧的室内框架使得对各种设计选择的模块化进行了模块化研究,从而影响了基于动态传输的生成模型:在离散或连续的时间内学习,目标函数,interpolant,interpolant,interpolant连接分布和确定性或确定性或确定性或结构性的样本。通过使用完全相同的模型结构,参数数量和gflops,仔细地引入上述成分,SIT在条件成像网256×256和512×512基准上均匀地超过DIT。通过调查各种扩散系数,可以与学习分开调整,SIT分别达到50k的得分为2.06和2.62。代码可在此处找到:https://github.com/willisma/sit
主要关键词
![arxiv:2401.08740v2 [cs.cv] 23 Sep 2024PDF文件第1页](/bimg/3/3c64938a1e16eb9ac045aa4804664c7b0c20ebf9.webp)
![arxiv:2401.08740v2 [cs.cv] 23 Sep 2024PDF文件第2页](/bimg/2/25de8d52e2ffce7c0cfdefa5bc6dcf3a614c1a2f.webp)
![arxiv:2401.08740v2 [cs.cv] 23 Sep 2024PDF文件第3页](/bimg/8/850fb3ebbe064604d88f40c401f7a32529c4012a.webp)
![arxiv:2401.08740v2 [cs.cv] 23 Sep 2024PDF文件第4页](/bimg/a/a3788c0411521da29fecde4382809ebfa8fb28cc.webp)
![arxiv:2401.08740v2 [cs.cv] 23 Sep 2024PDF文件第5页](/bimg/f/f66294605739fb5b2b13a5208ce7edc0878e27f2.webp)
